三代SV检测软件之cuteSV
三代SV检测软件之cuteSV
三代测序在检测基因组结构变异方面有着很大的优势,但是由于数据分析算法、软件还处于不断开发更新中,当前还没有公认推荐的软件。
这里为大家推荐一款国人开发的,可以同时兼顾PacBio和ONT平台数据的SV检测软件cuteSV。
背景
基因组结构变异(Structure variants, SV)在人类疾病,特别是罕见病中扮演了重要角色。当前,三代测序凭借其超长读长(一般超过了10 Kb)的优势,受到越来越多遗传病诊断人员的青睐。
软件简介
图2 软件cuteSV检测SV的主要过程
软件安装
#or
$ conda install -c bioconda cutesv
#or
$ git clone https://github.com/tjiangHIT/cuteSV.git && cd cuteSV/ && python setup.py install
注意,该软件是用Python3版本编写的,内部调用了一些常用软件,提前安装好即可,特别以下几款软件是必须的:
1. python3
2. pysam
3. Biopython
4. cigar
5. numpy
6. pyvcf
软件使用
--max_cluster_bias_INS 100
--diff_ratio_merging_INS 0.3
--max_cluster_bias_DEL 200
--diff_ratio_merging_DEL 0.5
> For PacBio CCS(HIFI) data:
--max_cluster_bias_INS 1000
--diff_ratio_merging_INS 0.9
--max_cluster_bias_DEL 1000
--diff_ratio_merging_DEL 0.5
> For ONT data:
--max_cluster_bias_INS 100
--diff_ratio_merging_INS 0.3
--max_cluster_bias_DEL 100
--diff_ratio_merging_DEL 0.3
软件实测
test.sorted.bam test.SV.vcf tmp_dir #输入输出文件定义
图4 SV结果统计
其他注意事项
1. 该软件目前只支持5种基本类型的SV,包括INS、DEL、INV、DUP、BND,对于复杂类型的SV暂时不支持。
2. 软件cuteSV检测到的SV同样包含IMPRECISE标签的SV,为了保证SV的准确性,减轻后期分析压力,可以考虑只保留PRECISE标签的SV。
参考资料
1. Kosugi, S. et al. Comprehensive evaluation of structural variation detection algorithms for whole genome sequencing. Genome Biol. 20, 8–11 (2019).
2. Jiang, T. et al. Long-read-based human genomic structural variation detection with cuteSV. Genome Biol. 21, 1–24 (2020).
3.软件GitHub地址: https://github.com/tjiangHIT/cuteSV
作者:大行山
审稿:童蒙
编辑:angelica
往 期 精 彩